智能论文笔记

RITA: Boost Autonomous Driving Simulators with Realistic Interactive Traffic Flow

Zhengbang Zhu , Shenyu Zhang , Yuzheng Zhuang , Yuecheng Liu , Minghuan Liu , Liyuan Mao , Ziqing Gong , Weinan Zhang , Shixiong Kai , Qiang Gu

分类：人工智能 | 机器人

2022-11-07

High-quality traffic flow generation is the core module in building simulators for autonomous driving. However, the majority of available simulators are incapable of replicating traffic patterns that accurately reflect the various features of real-world data while also simulating human-like reactive responses to the tested autopilot driving strategies. Taking one step forward to addressing such a problem, we propose Realistic Interactive TrAffic flow (RITA) as an integrated component of existing driving simulators to provide high-quality traffic flow for the evaluation and optimization of the tested driving strategies. RITA is developed with fidelity, diversity, and controllability in consideration, and consists of two core modules called RITABackend and RITAKit. RITABackend is built to support vehicle-wise control and provide traffic generation models from real-world datasets, while RITAKit is developed with easy-to-use interfaces for controllable traffic generation via RITABackend. We demonstrate RITA's capacity to create diversified and high-fidelity traffic simulations in several highly interactive highway scenarios. The experimental findings demonstrate that our produced RITA traffic flows meet all three design goals, hence enhancing the completeness of driving strategy evaluation. Moreover, we showcase the possibility for further improvement of baseline strategies through online fine-tuning with RITA traffic flows.

translated by 谷歌翻译

Random graph matching at Otter's threshold via counting chandeliers

Cheng Mao , Yihong Wu , Jiaming Xu , Sophie H. Yu

分类： (统计)机器学习

2022-09-25

我们根据计算一个扎根于每个顶点的某个加权树的家族而构成的相似性得分提出了一种有效的图形匹配算法。对于两个erd \ h {o} s-r \'enyi图$ \ mathcal {g}（n，q）$，其边缘通过潜在顶点通信相关联，我们表明该算法正确地匹配了所有范围的范围，除了所有的vertices分数外，有了很高的概率，前提是$ nq \ to \ infty $，而边缘相关系数$ \ rho $满足$ \ rho^2> \ alpha \ ailpha \大约0.338 $，其中$ \ alpha $是Otter的树木计数常数。此外，在理论上是必需的额外条件下，可以精确地匹配。这是第一个以显式常数相关性成功的多项式图匹配算法，并适用于稀疏和密集图。相比之下，以前的方法要么需要$ \ rho = 1-o（1）$，要么仅限于稀疏图。该算法的症结是一个经过精心策划的植根树的家族，称为吊灯，它可以有效地从同一树的计数中提取图形相关性，同时抑制不同树木之间的不良相关性。

translated by 谷歌翻译

Deep Anomaly Detection and Search via Reinforcement Learning

Chao Chen , Dawei Wang , Feng Mao , Zongzhang Zhang , Yang Yu

分类：机器学习

2022-08-31

半监督异常检测（AD）是一种数据挖掘任务，旨在从部分标记的数据集中学习功能，以帮助检测异常值。在本文中，我们将现有的半监督AD方法分为两类：无监督和基于监督的基于监督的，并指出其中大多数人对标记数据的利用不足和未经标记的数据的探索不足。为了解决这些问题，我们提出了深度的异常检测和搜索（DADS），该检测（DADS）应用了增强学习（RL）以平衡剥削和探索。在培训过程中，代理商通过层次结构的数据集搜索可能的异常情况，并使用搜索异常来增强性能，从本质上讲，这本质上从合奏学习的想法中汲取了教训。在实验上，我们将DAD与利用标记已知异常的标记为检测其他已知异常和未知异常的几种最新方法进行了比较。结果表明，爸爸可以从未标记的数据中有效，精确地搜索异常，并向它们学习，从而实现良好的性能。

translated by 谷歌翻译

HTML版本

AIM 2022 Challenge on Super-Resolution of Compressed Image and Video: Dataset, Methods and Results

Ren Yang , Radu Timofte , Xin Li , Qi Zhang , Lin Zhang , Fanglong Liu , Dongliang He , Fu li , He Zheng , Weihang Yuan

分类：计算机视觉

2022-08-23

本文回顾了AIM 2022上压缩图像和视频超级分辨率的挑战。这项挑战包括两条曲目。轨道1的目标是压缩图像的超分辨率，轨迹〜2靶向压缩视频的超分辨率。在轨道1中，我们使用流行的数据集DIV2K作为培训，验证和测试集。在轨道2中，我们提出了LDV 3.0数据集，其中包含365个视频，包括LDV 2.0数据集（335个视频）和30个其他视频。在这一挑战中，有12支球队和2支球队分别提交了赛道1和赛道2的最终结果。所提出的方法和解决方案衡量了压缩图像和视频上超分辨率的最先进。提出的LDV 3.0数据集可在https://github.com/renyang-home/ldv_dataset上找到。此挑战的首页是在https://github.com/renyang-home/aim22_compresssr。

translated by 谷歌翻译

PointDP: Diffusion-driven Purification against Adversarial Attacks on 3D Point Cloud Recognition

Jiachen Sun , Weili Nie , Zhiding Yu , Z. Morley Mao , Chaowei Xiao

分类：计算机视觉 | 机器学习

2022-08-21

3D点云正在成为许多现实世界应用中的关键数据表示形式，例如自动驾驶，机器人技术和医学成像。尽管深度学习的成功进一步加速了物理世界中3D点云的采用，但深度学习因其易受对抗性攻击的脆弱性而臭名昭著。在这项工作中，我们首先确定最先进的经验防御，对抗性训练，由于梯度混淆，在适用于3D点云模型方面有一个重大限制。我们进一步提出了PointDP，这是一种纯化策略，利用扩散模型来防御3D对抗攻击。我们对六个代表性3D点云体系结构进行了广泛的评估，并利用10+强和适应性攻击来证明其较低的稳健性。我们的评估表明，在强烈攻击下，PointDP比最新的纯化方法实现了明显更好的鲁棒性。在不久的将来将包括与PointDP合并的随机平滑验证结果的结果。

translated by 谷歌翻译

Dense Teacher: Dense Pseudo-Labels for Semi-supervised Object Detection

Hongyu Zhou , Zheng Ge , Songtao Liu , Weixin Mao , Zeming Li , Haiyan Yu , Jian Sun

分类：计算机视觉

2022-07-06

迄今为止，最强大的半监督对象检测器（SS-OD）基于伪盒，该盒子需要一系列带有微调超参数的后处理。在这项工作中，我们建议用稀疏的伪盒子以伪造的伪标签形式取代稀疏的伪盒。与伪盒相比，我们的密集伪标签（DPL）不涉及任何后处理方法，因此保留了更丰富的信息。我们还引入了一种区域选择技术，以突出关键信息，同时抑制密集标签所携带的噪声。我们将利用DPL作为密集老师的拟议的SS-OD算法命名。在可可和VOC上，密集的老师在各种环境下与基于伪盒的方法相比表现出卓越的表现。

translated by 谷歌翻译

Conversion Rate Prediction via Meta Learning in Small-Scale Recommendation Scenarios

Xiaofeng Pan , Ming Li , Jing Zhang , Keren Yu , Luping Wang , Hong Wen , Chengjun Mao , Bo Cao

分类：机器学习

2021-12-27

与淘宝和亚马逊等大型平台不同，由于严重的数据分配波动（DDF）问题，在小规模推荐方案中开发CVR模型是更具挑战性的。 DDF防止现有的CVR模型自生效以来，因为1）需要几个月的数据需要足够小的场景训练CVR模型，导致培训和在线服务之间的相当大的分布差异; 2）电子商务促销对小型情景产生了更大的影响，导致即将到期的时间段的不确定性。在这项工作中，我们提出了一种名为MetacVR的新型CVR方法，从Meta学习的角度解决了DDF问题。首先，由特征表示网络（FRN）和输出层组成的基础CVR模型是精心设计和培训的，在几个月内与样品充分设计和培训。然后，我们将不同数据分布的时间段视为不同的场合，并使用相应的样本和预先训练的FRN获得每个场合的正面和负原型。随后，设计了距离度量网络（DMN）以计算每个样本和所有原型之间的距离度量，以便于减轻分布不确定性。最后，我们开发了一个集合预测网络（EPN），该网络（EPN）包含FRN和DMN的输出以进行最终的CVR预测。在这个阶段，我们冻结了FRN并用最近一段时间的样品训练DMN和EPN，因此有效地缓解了分布差异。据我们所知，这是在小规模推荐方案中针对DDF问题的CVR预测第一次研究。实验结果对现实世界数据集验证了我们的MetacVR和Online A / B测试的优越性也表明我们的模型在PCVR上实现了11.92％的令人印象深刻的收益和GMV的8.64％。

translated by 谷歌翻译

SAME: Scenario Adaptive Mixture-of-Experts for Promotion-Aware Click-Through Rate Prediction

Xiaofeng Pan , Yibin Shen , Jing Zhang , Keren Yu , Hong Wen , Shui Liu , Chengjun Mao , Bo Cao

分类：机器学习

2021-12-27

促销活动在电子商务平台上变得更加重要和普遍，以吸引客户和提升销售。但是，推荐系统中的点击率（CTR）预测方法无法处理此类情况，因为：1）他们无法概括为服务，因为在线数据分布是不确定的，因为可能正在推出的促销潜在的促销; 2）在不够重视方案信号的情况下，它们无法学习在每个场景中共存的不同特征表示模式。在这项工作中，我们提出了方案自适应混合的专家（相同），这是一个简单而有效的模型，用于促销和正常情况。从技术上讲，它通过采用多个专家来学习专家来遵循专家混合的想法，这些特征表示通过注意机制通过特征门控网络（FGN）进行调制。为了获得高质量的表示，我们设计了一个堆叠的并行关注单元（SPAU），以帮助每个专家更好地处理用户行为序列。为了解决分布不确定性，从时间序列预测的角度精确地设计了一组场景信号，并馈入FGN，其输出与来自每个专家的特征表示连接，以学会注意。因此，特征表示的混合是自适应的场景和用于最终的CTR预测。通过这种方式，每个专家都可以学习鉴别的表示模式。据我们所知，这是第一次推广感知CTR预测的研究。实验结果对现实世界数据集验证了同一的优势。在线A / B测试也表现出同样的促销期间在CTR上的显着增益和5.94％的IPV，分别在正常日内为3.93％和6.57％。

translated by 谷歌翻译

Natural language processing to identify lupus nephritis phenotype in electronic health records

Yu Deng , Jennifer A. Pacheco , Anh Chung , Chengsheng Mao , Joshua C. Smith , Juan Zhao , Wei-Qi Wei , April Barnado , Chunhua Weng , Cong Liu

分类：机器学习

2021-12-20

Systemic Lupus红斑（SLE）是一种罕见的自身免疫疾病，其特征是令人无法预测的耀斑和缓解的速度，具有不同的表现形式。狼疮性肾炎，SLE用于器官损伤和死亡率的主要疾病表现之一，是卢布斯分类标准的关键组成部分。因此，准确地鉴定电子健康记录（EHRS）中的狼疮性肾炎将使大型队列观察研究和临床试验有益于患者人口的表征对于招聘，研究设计和分析至关重要。可以通过程序代码和结构化数据来认可狼疮肾炎，例如实验室测试。然而，记录狼疮肾炎的其他关键信息，例如来自肾脏活检和先前的医学史叙事的组织学报告，需要复杂的文本处理，以从病理报告和临床笔记中挖掘信息。在这项研究中，我们开发了使用EHR数据识别鉴定狼疮肾炎的血管肾炎，而不使用自然语言处理（NLP）。我们开发了四种算法：仅使用结构化数据（基线算法）和使用不同NLP模型的三种算法的规则的算法。这三种NLP模型基于正则化逻辑回归，并使用不同的特征集，包括积极提及概念独特标识符（Cue），耐备的外观数量，以及三个部件的混合物。基线算法和最佳执行的NLP算法在Vanderbilt University Center（VUMC）的数据集上验证了外部验证。我们最佳地执行来自结构化数据，正则表达式概念和映射的特征的NLP模型，与基线狼疮性肾炎算法相比，在NMEDW（0.41 VS 0.79）和VUMC（0.62 VS 0.96）数据集中有所改善。

translated by 谷歌翻译

Knowledge-Grounded Dialogue Generation with a Unified Knowledge Representation

Yu Li , Baolin Peng , Yelong Shen , Yi Mao , Lars Liden , Zhou Yu , Jianfeng Gao

分类：自然语言处理

2021-12-15

由于缺乏培训数据和异质知识来源，知识接地的对话系统是挑战的。由于培训数据中涵盖的有限主题，现有系统在不良主题上表现不佳。此外，异构知识源使系统概括到其他任务的系统，因为不同知识表示中的知识来源需要不同的知识编码器。为了解决这些挑战，我们呈现插头，将不同知识来源均匀化为知识接地的对话生成任务的统一知识来源的语言模型。插头在对话生成任务上进行预先培训，调节统一的基本知识表示。它可以通过一些培训示例概括到不同下游知识接地的对话一代任务。两个基准测试的实证评估表明，我们的模型越好跨越不同的知识接地任务。它可以在完全监督的设置下实现具有最先进的方法的可比性，并且显着优于零拍摄和少量拍摄设置中的其他方法。

translated by 谷歌翻译